#ataque adversarial

Adv-TGD: Ataque generativo adversarial basado en texto para reconocimiento facial

Descubre Adv-TGD, el nuevo ataque adversarial que engaña sistemas de reconocimiento facial con 85.9% de éxito y alta calidad visual.

2026-06-11 · 2 min

Corrección de sesgo para mejorar transferibilidad adversarial en VLP

Mejora la transferibilidad adversarial en modelos VLP con DeBias-Attack, que corrige el sesgo del modelo sustituto para ataques más efectivos.

2026-06-10 · 2 min

Generación adversarial y entrenamiento robusto en optimización combinatoria neuronal

Generación de instancias adversariales y entrenamiento robusto para optimización combinatoria multiobjetivo. Mejora el rendimiento en distribuciones complejas.

2026-06-09 · 1 min

SlotGCG: Explotando vulnerabilidades posicionales en LLMs

SlotGCG explota vulnerabilidades posicionales en prompts para jailbreak. Logra un 14% más de éxito que GCG, con solo 200ms de preprocesamiento. Descubre cómo.

2026-06-05 · 1 min

Vectores de dirección: una superficie de ataque adversarial

Descubre cómo un ataque de envenenamiento sigiloso en vectores de dirección puede burlar la seguridad de LLMs. Aprende sobre la defensa ortogonalización.

2026-06-05 · 2 min

TRAP: Secuestro del razonamiento CoT en VLA mediante parches adversariales

Descubre cómo TRAP usa parches adversariales para secuestrar razonamiento CoT en robots VLA y provocar comportamientos peligrosos. Vulnerabilidad crítica en IA.

2026-06-03 · 3 min

Sensibilidad: espada de doble filo entre discriminabilidad y robustez

Descubre cómo la sensibilidad de clasificadores es un arma de doble filo, y cómo HPM equilibra discriminabilidad y robustez adversarial. ¡Lee más!

2026-06-02 · 3 min

Jailbreaking en MLLMs usando video multi-clip

¿Sabías que los modelos de IA multimodales son más vulnerables a ataques con video que con imágenes? Un estudio revela cómo el video multi-clip aumenta el éxito de los jailbreaks.

2026-06-02 · 2 min

Ataque A* multiagente de ofuscación de sentido común en prompts LLM

Descubre un framework A* multiagente que ofusca prompts de LLM, induciendo alucinaciones de sentido común con alta eficacia y pocos intentos.

2026-06-02 · 3 min

Ataques automáticos a agentes de IA de ingeniería inversa

Descubre cómo ataques adversariales mediante algoritmos genéticos pueden engañar a agentes de IA en ingeniería inversa, ocultando código malicioso en binarios.

2026-06-01 · 1 min